首页> 外文OA文献 >Design of Automatically Adaptable Web Wrappers
【2h】

Design of Automatically Adaptable Web Wrappers

机译:自适应Web包装器的设计

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Nowadays, the huge amount of information distributed through the Webmotivates studying techniques to be adopted in order to extract relevant datain an efficient and reliable way. Both academia and enterprises developedseveral approaches of Web data extraction, for example using techniques ofartificial intelligence or machine learning. Some commonly adopted procedures,namely wrappers, ensure a high degree of precision of information extractedfrom Web pages, and, at the same time, have to prove robustness in order not tocompromise quality and reliability of data themselves. In this paper we focuson some experimental aspects related to the robustness of the data extractionprocess and the possibility of automatically adapting wrappers. We discuss theimplementation of algorithms for finding similarities between two differentversion of a Web page, in order to handle modifications, avoiding the failureof data extraction tasks and ensuring reliability of information extracted. Ourpurpose is to evaluate performances, advantages and draw-backs of our novelsystem of automatic wrapper adaptation.
机译:如今,通过Web分发的大量信息促使人们采用研究技术,以高效,可靠的方式提取相关数据。学术界和企业都开发了几种Web数据提取方法,例如使用人工智能或机器学习技术。一些通常采用的过程,即包装程序,可以确保从网页提取的信息的高度准确性,同时,必须证明其健壮性,以免损害数据本身的质量和可靠性。在本文中,我们重点关注与数据提取过程的鲁棒性和自动调整包装器的可能性有关的一些实验方面。我们讨论了用于查找网页的两个不同版本之间的相似性的算法的实现,以便处理修改,避免数据提取任务失败并确保提取的信息的可靠性。我们的目的是评估我们的自动包装程序自适应新系统的性能,优势和缺点。

著录项

  • 作者单位
  • 年度 2011
  • 总页数
  • 原文格式 PDF
  • 正文语种 {"code":"en","name":"English","id":9}
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号